“배재대학교 호텔여가서비스경영학과”
“송학준”
2019-01-22
빅데이터 시대, R 프로그래밍 입문: 유료 패키지 SPSS를 오픈소스 패키지 R로 대체하기
빅데이터 시대를 맞이하여 유료 통계패키지는 사용가격이 비싸거나 라이센스 문제로 인해 사용이 점차 복잡해지고 어려워지고 있음. 뿐만 아니라 정형화된 유료 통계패키지는 급속히 발전하는 최신 통계기법을 빠르게 수용하기 어려워 연구의 기법향상에 어려움이 있어 왔음 이러한 상황에서 본 강의는 사회과학의 핵심 통계기법(구조방정식, 회귀분석, 상관분석, t-test, ANOVA, 빈도분석 등)을 오픈소스 패키지인 R에서 사용하는 방법을 짧게나마 학습해 보고 이를 기반으로 연구의 기법향상을 보다 용이하게 할 수 있는 방안을 모색해 보고자 함
오른쪽 마우스 -> 설정 -> 호환성 -> 관리자 권한으로 이 프로그램 실행 -> 확인)File -> New file -> R script를 선택하면 4개의 창이 나타남| 스크립트창: 프로그램을 입력 스크립트상에서 원하는 만큼 영역을 설정하고 이후 Run버튼을 눌러서 실행 | Global environment: 데이터가 입력된 변수 및 데이터셋의 이름 |
|---|---|
| Console:명령어 진행과 결과를 보여줌 | File: 작업파일들의 경로 확인 Plots: 분석결과가 그림인 경우 여기에 그림이 나타남 Packages: 패키지들의 설정상황이나 새로운 패키지들을 인스톨할때 이용 Help: 명령어를 모를때 검색가능 Viewer: 분석결과가 인터넷등의 웹과 관계된 결과들이 나타나는곳 |
1.R 설치
2.RStudio 설치
3.Java 설치
아래로 스크롤 하여 해당하는 국가의 링크를 클릭
윈도우 사용자는 윈도우 선택
기본 프로그램인 base를 클릭
Download R 3.5.0 for Windows를 눌러 파일을 다운로드함. 호환성을 위해서 이전 버전을 설치하는 경우도 있음
언어를 선택한 후에 중요한 작업이 있음
다음을 클릭
프로그램 경로선택시 한글로 된 경로가 절대로 포함되면 안되니 주의하기 바람
최근 대다수의 컴퓨터가 64비트를 사용하므로 64비트를 선택. 혹시 32비트를 사용하는 경우 32비트를 선택하기 바람
여기서 운영체제 항목을 보면 64비트로 표시되어 있음
위와 같이 설정되어 있음을 확인
다음 버튼 클릭
원하는 대로 설정 후 다음 버튼 클릭
다음 버튼 클릭
설치가 완료되었음
바탕화면에 있는 아이콘을 눌러 실행해보면 다음과 같은 화면이 나타남
RStudio를 설치하기 위해 RStudio 홈페이지로 이동
RStudio의 강점은 오픈소스라는 것임. FREE 아래에 있는 DOWNLOAD 버튼 클릭
RStudio는 특별한 설정이 필요하지 않으므로 계속 다음 버튼을 눌러 설치를 완료
하지만 다양한 패키지를 사용하기 위해서는 Java가 필요한 경우가 있음
설치를 마친 후 원활하게 프로그램을 사용하기 위해 RStudio 를 간단히 설정해야 함
우선 RStudio를 실행해 준 후 Tools – Global option을 클릭
경로에 한글이 포함되면 안됨.
바탕화면에 있는 RStudio 아이콘을 우클릭 한 후 파일 위치 열기 버튼을 눌러줌
첫번째로 호환성 버튼을 눌러 이동한 후 관리자 권한으로 이 프로그램을 실행 박스에 체크한 후 확인을 눌러줌
Tools > Global options
Apperance > Edit Font size
Apperance > Editor themes
설정한대로 아래와 같이 변경됨
Markdown은 텍스트 기반의 마크업언어로 2004년 John Gruber에 의해 만들어졌음. 쉽게 쓰고 읽을 수 있으며 HTML로 변환 가능하다는 장점이 있음 마크다운이 최근 각광받기 시작한 이유는 github 덕분인데 github의 repository에 관한 정보를 기록하는 README.md는 github을 사용하는 사람이라면 누구나 가장 먼저 접하게 되는 markdown 문서였음.
R markdown을 이용하면 데이터 분석 과정에서 데이터에 접근하고 코드를 실행시키며 동시에 레포트를 작성이 가능하다.R markdown은 다음과 같이 구성되어 있음.
install.packages("rmarkdown")
도움이 될 resources
The R Markdown Cheatsheet
The R Markdown Reference Guide
The Official R Markdown Website
R마크다운 컨닝쪽지
이제 R markdown 문법에 맞게 문서를 작성하면 되는데 작성한 문서를 HTML파일로 변환하기 위해서는 .Rmd창 아래 Knit HTML버튼을 클릭하면 문서가 생성됨
This is an H1
=============
This is an H2
-------------
#으로 머릿글을 나타냄#의 개수에 따라 머릿글의 크기가 조정되고 # 1개가 가장 큰 머릿글이됨# ESC
## ESC
### ESC
#### ESC
##### ESC
###### ESC
markdown에서 text를 작성하다 line break 즉 행바꿈을 하기위해서는 바꾸고자 하는 글의 끝에 2개 이상의 space를 입력해야 행이 바뀜
2개 이상의 space를 입력하지 않았을 때 아래와 같이 나타남 서울과학기술대학교 데이터사이언스 이강혁
2개 이상의 space를 입력하였을 때는 아래와 같이 나타남 서울과학기술대학교
데이터사이언스
이강혁
> This is a blockquote.
This is the first blockquote.
1. 첫번째
2. 두번째
3. 세번째
* 빨강
* 녹색
* 파랑
***
* * *
*****
- - -
Link: [Google](https://google.com)
Link: Google
* 또는 _를 입력하면 됨(공백없이)** 또는 __를 입력하면 됨(공백없이)'를 취소선은 양끝에 ~~를 사용할 수 있음*italics*
**bold**
`backticks`
~~cancelline~~
italics
bold
backticks
cancelline

x <- 1:10 # 1부터 10까지 만들어서 x변수에 할당
y <- round(rnorm(10, x, 1), 2) # 평균이 x이고 표준편차가 1인 10개의 난수를 발생시키되 소수점을 2자리로 하고 각 값들을 y변수에 할당
df <- data.frame(x, y) # x와 y변수 그룹을 하나의 데이터 프레임으로 만들어서 df에 저장
df # df출력
| x | y |
|---|---|
| 1 | -1.51 |
| 2 | 2.27 |
| 3 | 1.87 |
| 4 | 3.94 |
| 5 | 4.21 |
| 6 | 5.55 |
| 7 | 8.03 |
| 8 | 7.28 |
| 9 | 9.91 |
| 10 | 8.65 |
HTML 출력결과 코드와 df 결과가 위와 같이 나타나게 됨